Consulta de Guías Docentes



Academic Year/course: 2023/24

534 - Master's Degree in Informatics Engineering

62225 - Management of Large-Scale Data


Syllabus Information

Academic year:
2023/24
Subject:
62225 - Management of Large-Scale Data
Faculty / School:
110 - Escuela de Ingeniería y Arquitectura
Degree:
534 - Master's Degree in Informatics Engineering
ECTS:
6.0
Year:
1
Semester:
Second semester
Subject type:
Compulsory
Module:
---

1. General information

This subject aims to achieve the following objectives:

  • Help the student to analyse the requirements for the management of a problem that involves large volumes of data (storage, transfer, processing, visualization and interaction).
  • Help the student to develop the necessary elements to integrate heterogeneous data sources, using classic techniques for representation, processing, analysis, visualization and interaction with heterogeneous data repositories.
  • Help the student to develop an application for a given context, where the management of large volumes of data is necessary, taking into account criteria of scalability, usability and regulations.

These approaches and objectives are aligned with the Sustainable Development Goals (SDG) of the United Nations 2030 Agenda ( https://www.un.org/sustainabledevelopment/es/), specifically, the learning activities provided for in this subject will contribute to the achievement of Objective 10.2 of Goal 10.

2. Learning results

Upon completion of this subject, the student will be able to:

  1. Understand and specify the necessary requirements for the interaction, storage, transfer, and processing of large volumes of data.
  2. Know, understand and apply the most common techniques for the representation, treatment, analysis of and interaction with heterogeneous data repositories.
  3. Design, develop and evaluate an application that facilitates the creation and management of large volumes of data, in accordance with scalability criteria and existing regulations.

3. Syllabus

  • Introduction to and motivation of the problem of large volumes of data ( Big Data ).
  • Storage of large volumes of data:
    • Data warehouses Star design.
    • NoSQL databases.
  • Management of large volumes of data:
    • Data distribution.
    • Integration of information with heterogeneous data sources.
    • Use of knowledge representation techniques (ontologies) for the representation of data sources and their access and integration.
    • Parallel processing techniques: MapReduce (Hadoop).
    • Data stream management systems.
    • Other techniques: mobile agents.
  • Interaction with large volumes of data:
    • Visualization techniques.
    • Design of appropriate user interfaces.
    • Usability.
  • Analysis of large volumes of data:
    • Data mining.
    • Text mining, sentiment analysis.
  • Use cases and applications, such as:
    • Data coming from sensors.
    • Unstructured data on the Web.
    • Recommendation systems.
    • Analysis of blogs and social networks.
    • Smart cities
    • Intelligent transportation systems.

4. Academic activities

The subject consists of 6 ECTS which represent around 150 hours of student´s dedication, distributed as follows: 

  • Activities directed by the subject's teaching staff: 60 h (master class, problem and case solving, laboratory practices, special practices)
  • Completion of practical application or research work: 65 h
  • Theory study: 20 h
  • Assessment tests: 5 h

5. Assessment system

The student must demonstrate that they has achieved the expected learning results through the following assessment activities:

  • Production and presentation of work . Study of a topic related to the subject, preparation of a report on the same, and presentation in class. [20%]. Learning results: 1, 2 and 3
  • Project . A group project with computers, in which the knowledge and skills acquired in the subject will be put into practice. [50%]. Learning results: 1, 2 and 3
  • Final written test including short answer and long answer questions . [30%]. Learning results: 1, 2 and 3

In order to average all the grades, it will be necessary to individually pass each of the evaluation activities.

The student who does not choose the evaluation procedure described above, does not pass these tests during the teaching period, or who would like to improve their grade, will be entitled to a comprehensive test, which will be scheduled within the exam period corresponding to the first or second call, as appropriate. This comprehensive test will consist of the following evaluation activities: 1) completion and presentation of the previously indicated work (study of a subject) [20%], 2) completion and defence of the project (subject practices) [50%], and 3) completion of a final written test including short answer and long answer questions [30%]. In order to average all the grades, it will be necessary to individually pass each of the evaluation activities.


Curso Académico: 2023/24

534 - Máster Universitario en Ingeniería Informática

62225 - Manipulación y análisis de grandes volúmenes de datos


Información del Plan Docente

Año académico:
2023/24
Asignatura:
62225 - Manipulación y análisis de grandes volúmenes de datos
Centro académico:
110 - Escuela de Ingeniería y Arquitectura
Titulación:
534 - Máster Universitario en Ingeniería Informática
Créditos:
6.0
Curso:
1
Periodo de impartición:
Segundo semestre
Clase de asignatura:
Obligatoria
Materia:
---

1. Información básica de la asignatura

Con el desarrollo de la asignatura se pretenden lograr los siguientes objetivos:

  • Que el estudiante analice, dado un problema que implica grandes volúmenes de datos, los requisitos necesarios para su gestión (almacenamiento, transferencia, procesamiento, visualización e interacción).
  • Que el estudiante desarrolle los elementos necesarios para integrar fuentes de datos heterogéneas, utilizando técnicas clásicas para la representación, tratamiento, análisis, visualización e interacción con repositorios de datos heterogéneos.
  • Que el estudiante desarrolle una aplicación para un contexto dado, donde sea necesaria la gestión de grandes volúmenes de datos, y teniendo en cuenta criterios de escalabilidad, usabilidad y normativos.

Estos planteamientos y objetivos están alineados con los Objetivos de Desarrollo Sostenible (ODS) de la Agenda 2030 de Naciones Unidas (https://www.un.org/sustainabledevelopment/es/), en concreto, las actividades de aprendizaje previstas en esta asignatura contribuirán a al logro de las metas 10.2 del Objetivo 10.

2. Resultados de aprendizaje

El estudiante, para superar esta asignatura, deberá demostrar los siguientes resultados...

  1. Comprender y especificar los requisitos necesarios para la interacción, almacenamiento, transferencia y procesado de grandes volúmenes de datos.
  2. Conocer, comprender y aplicar las técnicas más comunes para la representación, tratamiento, análisis e interacción con repositorios de datos heterogéneos.
  3. Diseñar, desarrollar y evaluar una aplicación que facilite la elaboración y gestión de grandes volúmenes de datos, conforme a criterios de escalabilidad y normativa existente.

3. Programa de la asignatura

  • Introducción y motivación al problema de los grandes volúmenes de datos (Big Data).
  • Almacenamiento de grandes volúmenes de datos:
    • Almacenes de datos (data warehouses). Diseño en estrella.
    • Bases de datos NoSQL.
  • Gestión de grandes volúmenes de datos:
    • Distribución de los datos.
    • Integración de información con fuentes de datos heterogéneas.
    • Uso de técnicas de representación del conocimiento (ontologías) para la representación de fuentes de datos y su acceso e integración.
    • Técnicas de procesamiento paralelo: MapReduce (Hadoop).
    • Sistemas de gestión de flujos de datos (data streams).
    • Otras técnicas: agentes móviles.
  • Interacción con grandes volúmenes de datos:
    • Técnicas de visualización.
    • Diseño de interfaces de usuario apropiados.
    • Usabilidad.
  • Análisis de grandes volúmenes de datos:
    • Minería de datos.
    • Minería de textos, análisis del sentimiento.
  • Casos de uso y aplicaciones, tales como:
    • Datos provenientes de sensores.
    • Datos no estructurados en la Web.
    • Sistemas de recomendación.
    • Análisis de blogs y redes sociales.
    • Ciudades inteligentes (smart cities).
    • Sistemas de Transporte Inteligentes.

4. Actividades académicas

La asignatura consta de 6 créditos ECTS que suponen una dedicación estimada por parte del estudiante de 150 horas distribuidas del siguiente modo: 

  • Actividades dirigidas por el profesorado de la asignatura: 60 h (Clase magistral, Resolución de problemas y casos, Prácticas de laboratorio, Prácticas especiales)

  • Realización de trabajos de aplicación o investigación prácticos: 65 h

  • Estudio de teoría: 20 h

  • Pruebas de evaluación: 5 h

5. Sistema de evaluación

El estudiante deberá demostrar que ha alcanzado los resultados de aprendizaje previstos mediante las siguientes actividades de evaluacion

  • Realización y presentación de trabajos. Estudio de un tema relacionado con la asignatura, elaboración de un informe sobre el mismo, y su presentación en clase. [20%]. Resultados de aprendizaje: 1, 2 y 3.
  • Proyecto. Un proyecto de grupo con ordenadores, en el que se podrán en práctica los conocimientos y habilidades adquiridos en la asignatura. [50%]. Resultados de aprendizaje: 1, 2 y 3.
  • Prueba final escrita incluyendo preguntas de respuesta corta y de respuesta extensa. [30%]. Resultados de aprendizaje: 1, 2 y 3.

Para promediar, será necesario aprobar individualmente cada una de las actividades de evaluación.

El estudiante que no opte por el procedimiento de evaluación descrito anteriormente, que no supere dichas pruebas durante el periodo docente o que quisiera mejorar su calificación, tendrá derecho a realizar una prueba global que será programada dentro del periodo de exámenes correspondiente a la primera o segunda convocatoria, según corresponda. Dicha prueba global constará de las siguientes actividades de evaluación: 1) realización y presentación del trabajo indicado previamente (estudio de un tema) [20%], 2) realización y defensa del proyecto (prácticas de la asignatura) [50%], y 3) realización de una prueba final escrita incluyendo preguntas de respuesta corta y de respuesta extensa [30%]. Para promediar, será necesario aprobar individualmente cada una de las actividades de evaluación.